#인공지능 연구

사카나 AI, 역전파 없이 MNIST 96.7% 달성하는 새 AI 훈련법 공개

사카나 AI(Sakana AI)는 인간의 뇌와 같이 생물학적으로 구현 불가능한 기존의 가중치 전달(역전파) 방식을 대체하는 '오차 확산(Error Diffusion)' 기술을 제안했습니다. 이 접근법은 데이브의 원칙(Dale's principle)을 준수하는 이중 스트림 네트워크를 훈련시켜, 역전파 없이도 MNIST에서 96.7%, CIFAR-10에서 61.7%의 높은 정확도를 달성했습니다. 이는 생물학적 신경망의 원리에 가까운 차세대 효율적 AI 아키텍처 및 강화학습 연구에 중요한 전환점을 제시합니다.

역전파 대체 사카나 AI 생물학적 신경망

Hacker News • 13일 전

IMP 7

LLM, 컴퓨터 구조 논문의 깊은 기술적 이해 가능?

대형 언어 모델(LLM)이 컴퓨터 아키텍처 논문을 단순 요약을 넘어 깊은 수준으로 기술적으로 이해하고 비평할 수 있는지 연구한 논문입니다. 연구진은 5명의 전문가 페르소나와 적대적 통합 단계로 구성된 멀티 에이전트 파이프라인 'Gauntlet'을 구축해 평가했습니다. 그 결과, 다수의 연구자들이 인간의 분석보다 다중 에이전트 기반의 AI 분석을 더 선호하며 특히 비판적 엄격성에서 뛰어난 성능을 보였습니다.

LLM 논문 리뷰 멀티 에이전트

MarkTechPost • 29일 전

IMP 7

메타 AI, 비침습적 뇌파 텍스트 변환 모델 공개

메타 AI가 뇌파(MEG) 신호를 텍스트로 변환하는 비침습적 파이프라인인 'Brain2Qwerty v2'를 공개했습니다. 이 모델은 사람이 문장을 타이핑할 때 발생하는 뇌 신호를 분석해 61%의 단어 정확도를 달성했으며, AI 연구를 위해 훈련 코드를 오픈소스로 공개했다는 점에서 큰 의의가 있습니다.

메타 AI 뇌-컴퓨터 인터페이스 오픈소스

Hacker News • 54일 전

IMP 6

숫자 없는 수학: LLM은 어떻게 수학을 할까?

LLM(대형 언어 모델)이 실제로 숫자를 계산하는 것이 아니라, 수학적 연산과 피연산자를 벡터 형태로 인코딩하여 처리한다는 사실을 탐구한 글입니다. 외부 프로브(probe)를 모델의 은닉 벡터에 투입해 훈련시키면 '이 연산이 GCD(최대공약수)인가?' 또는 '피연산자가 84인가?'와 같은 질문에 정확히 대답할 수 있음을 보여줍니다. 이는 모델의 행동을 직접 유도한 것은 아니지만, 모델 내부에 수학적 정보가 읽기 가능한 형태로 존재한다는 것을 증명합니다.

인공지능 연구 LLM 해석가능성 수학적 추론

Hacker News • 56일 전

IMP 9

LLM은 더 이상 미지의 블랙박스가 아닙니다

LLM의 내부 작동 원리를 역설계하여 모델이 실제로 '생각'하는 과정을 추적하는 '기계적 해석 가능성(Mechanistic interpretability)' 연구가 큰 진전을 보이고 있습니다. 최근 Anthropic의 연구에 따르면 LLM은 인간이 이해할 수 있는 고수준의 개념들을 통해 실제로 다단계 추론을 수행하며, 고유의 '잠재의식' 과정을 거치는 것으로 밝혀졌습니다. 이는 AI의 오작동을 방지하고 성능을 향상시키는 핵심 기반이 될 수 있어 매우 중요한 의미를 갖습니다.

해석가능성 LLM Anthropic

Hacker News • 63일 전

IMP 8

언어 모델도 수면이 필요하다

최근 트랜스포머 기반 대형 언어 모델(LLM)은 문맥 길이가 길어질수록 어텐션 메커니즘의 연산 효율이 급격히 떨어지는 한계를 보입니다. 이를 해결하기 위해 본 논문은 인간의 '수면'과 유사한 통합 메커니즘을 제안하여, 모델이 최근 문맥을 영구적인 빠른 가중치(fast weights)로 변환하고 기존의 키-값 캐시를 초기화하는 방식을 도입했습니다. 기존 모델들이 실패한 복잡한 수학적 추론 작업에서도 이 방법론이 뛰어난 성능 향상을 보여주며, 깊은 추론이 필요한 문제일수록 효과가 극대화된다는 점이 핵심적인 성과입니다.

대형 언어 모델 트랜스포머 컨텍스트 윈도우

TechCrunch AI • 69일 전

IMP 8

오픈AI, 80년된 수학 난제 최초로 해결

오픈AI가 수학계의 거장 폴 에르되시가 1946년에 제기한 지오메트리 미해결 추측을 기각하는 완전히 새로운 증명을 AI 모델이 자율적으로 생성했다고 발표했습니다. 과거 기존 문헌의 해답을 '새로운 풀이'로 오해했던 전철을 밟지 않기 위해, 이번에는 에르되시 문제 웹사이트 관리자인 토마스 블룸 등 저명한 수학자들의 검증과 지지 성명을 동반했습니다. 이번 증명은 수학 전용 시스템이 아닌 범용 추론(reasoning) 모델에서 도출된 점이 핵심이며, 장기적이고 복잡한 논리적 사고가 가능해진 AI의 발전이 향후 물리학, 공학, 의학 등 타 분야에도 지대한 영향을 미칠 것임을 시사합니다.

OpenAI 수학 증명 추론 모델

r/singularity • 69일 전

IMP 9

OpenAI 범용 모델, 80년 된 수학 난제 자율 해결

OpenAI의 범용 추론 모델이 1946년 폴 에르되시(Paul Erdős)가 제기한 '평면 단위 거리 문제(Planar Unit Distance Problem)'의 기존 통념을 반증하는 새로운 구조를 자율적으로 발견했습니다. 수학 분야의 핵심적인 미해결 난제를 AI가 단독으로 해결한 최초의 사례로, 수학계와 AI 산업 양쪽에 중요한 마일스톤이 됩니다. 전문적인 수학 문제 해결에 특화되지 않은 일반 목적의 모델이 길고 복잡한 추론 과정을 거쳐 성과를 냈다는 점에서 AI의 추론 능력 한계 돌파를 시사합니다.

인공지능 연구 수학 난제 해결 범용 추론 모델

Wired AI • 95일 전

IMP 8

소니 AI 탁구 로봇 '에이스(Ace)', 프로 선수도 상대하는 압도적 실력

소니 AI 연구진이 개발한 탁구 로봇 '에이스(Ace)'가 공식 규칙 하에 인간 고급 아마추어 및 프로 선수들과 경기를 치르며 승리를 거두는 기술적 이정표를 세웠습니다. 고속 센서, 실시간 의사결정 AI, 8관절 고속 로봇 팔을 결합하여 복잡하고 빠르게 변하는 실제 물리 환경에서 인간과 대등한 반응 속도와 제어력을 입증했습니다. 이 성과는 탁구를 넘어 예측 불가능한 실세계 환경에서 정확하고 빠르게 작동해야 하는 산업 전반의 실용적인 로봇 응용 분야를 여는 핵심 전기로 평가받습니다.

로봇 공학 소니 AI 인공지능 연구

r/MachineLearning • 100일 전

IMP 7

매일 쏟아지는 AI 논문: arXiv ML 분야 일일 100~200편 게재

프론티어 AI 모델 경쟁이 치열해지며 머신러닝 및 AI 관련 연구 논문이 매일 폭발적으로 증가하고 있습니다. 최근 5일(4월 14일~20일) 동안 arXiv의 머신러닝 카테고리에만 총 896편의 새로운 논문이 올라왔으며, 하루 평균 약 180편에 달하는 수치입니다. 이는 LLM(대형 언어 모델) 미세조정, 보상 해킹 방지, 신약 개발 등 다양한 산업계 실무 응용 연구가 전 세계적으로 매우 빠르게 진행되고 있음을 시사합니다.

머신러닝 논문 동향 arXiv